最近,开发了EAGL-I系统是为了迅速创建大量标记的植物数据集,该数据集旨在被农民和研究人员普遍使用,以创建农业中的AI驱动解决方案。结果,由40,000张图像组成的公开植物识别数据集与系统一起创建了由8种植物物种组成的不同尺寸的图像,以证明其能力。本文提出了一种新颖的方法,称为可变重叠的时间连续滑动窗口(fotcsw),该方法将由图像组成的图像转换为具有可变大小的图像的数据集,为3D表示,具有适合卷积神经网络的固定大小,并证明了此表示形式是比将数据集的图像调整到给定尺寸的信息更丰富。我们从理论上正式化了该方法的用例及其固有的属性,我们证明了它对数据具有过采样和正则化效果。通过将Fotcsw方法与最近提出的称为1维多项式神经网络的机器学习模型的3D扩展相结合,我们能够创建一个模型,该模型在数据集中创建的数据集中达到了99.9%的最新精度, EAGL-I系统超过了众所周知的建筑,例如重新系统和启动。此外,我们创建了一种启发式算法,该算法能够降低任何预先训练的N维多项式神经网络,并在不改变其性能的情况下压缩它,从而使模型更快,更轻。此外,我们确定当前可用的数据集无法以目前的形式用于机器学习,这是因为训练集和测试集之间存在很大的类不平衡。因此,我们创建了一个特定的预处理和模型开发框架,使我们能够将准确性从49.23%提高到99.9%。
translated by 谷歌翻译